查看原文
其他

听过无数次的地平线机器人到底是做什么的?这下终于读懂了

2016-04-30 DeepTech深科技 线性资本
小线说

从百度深度学习研究院执行院长,到创立地平线做机器人芯片,再到获得传奇风投大佬尤里·米尔纳的投资,余凯带着地平线机器人成了人工智能领域一个知名度很高的新星,一时间似乎身边做AI的朋友都在问:


地平线到底是家做什么的公司?


近日来自MIT科技评论的DeepMind深科技团队探访了地平线办公室,为大家带来了一篇干货满满而又深入浅出的深度报道。


还是没太看明白?没关系,在文末寻找参与方式,线性资本“聚线堂”第一期,让你与地平线技术团队零距离接触!

小线说


本文转自DeepTech深科技



https://v.qq.com/txp/iframe/player.html?vid=b0196kbn0h6&width=500&height=375&auto=0

我们先来看一段演示视频,视频中展示的“先进辅助驾驶系统”(Advanced Driver Assistance Systems,ADAS)是近年来业内积极发展的智能车辆技术之一,该系统是将来真正实现无人驾驶的技术进阶过程。ADAS的主要功能并不是直接控制汽车,而是为驾驶员提供车辆工作情况与车外环境变化等相关资讯。

 

而这段视频中的技术采用的是单目摄像头算法,来实现对车道线(橙色)、行人(红色框体)、车辆(绿色框体)的识别,从而实现汽车、行人以及路标多种目标检测感知,对可能发生的碰撞危险进行预警及应急处理。



编者注:上面技术项目的开发者是一家名为地平线机器人的创业公司。该公司创始人是前百度深度学习研究院负责人余凯。本月初DT君来到这家公司位于中关村的北京总部。


在采访中DT君得知,地平线机器人所从事的产品,简而言之是人工智能的解决方案。地平线的客户大多会是消费类电子产品生产商。凭借地平线提供的服务,这些电子类产品能够具备一些AI功能,包括感知、交互、理解、甚至是决策。


截止目前,地平线共发布了两套产品:针对智能家居的“安徒生”系统和针对智能驾驶的“雨果”系统。开发者基于这些平台可以开发各种各样的应用,比如语音、图像等。地平线告诉DT君,针对辅助驾驶所开发的技术,已经被一家国际上数一数二的Tier-1汽车技术供应商所采用。


无疑,余凯在深度学习领域具备相当的号召力。地平线去年9月完成首轮融资,投资人包括晨兴资本、高瓴资本、红杉资本、金沙江创投、线性资本、创新工场及真格基金等机构。今年年初,地平线获得了著名风险投资家Yuri Milner的投资。



地平线机器人在北京的办公室


在这次采访中,DT君见到了地平线机器人的四位创始人。不出意料,创始团队简历令人印象深刻:


创始人余凯博士,在创业之前,他是百度深度学习研究院(IDL)的创立者和负责人,国家千人计划特聘专家,曾在百度领导了语音识别、图像搜索、百度大脑、百度无人驾驶等项目。


联合创始人兼软件副总裁杨铭博士, Facebook 人工智能研究院(FAIR)创始成员之一,曾在Facebook 负责DeepFace项目。


联合创始人兼算法副总裁黄畅博士,曾担任百度主任架构师,长期从事计算机视觉、机器学习、模式识别和信息检索方面的核心算法研发。


联合创始人兼硬件副总裁方懿女士, 曾任诺基亚大中华区研发副总裁,并带领团队设计、研发和推出诺基亚历史上最成功的智能手机Lumia520。

 


地平线机器人四位创始人:余凯、方懿、杨铭、黄畅(从左至右)

 

采访全文如下,由“DeepTech深科技”编辑整理。


Q:地平线的机器人芯片跟传统芯片,以及现有神经网络芯片,如高通Zeroth、IBM的TrueNorth相比,区别在哪里?


余凯:我们主要是做深度神经网络芯片,跟传统CPU芯片相比,CPU是做所有事情,所以一般是串行结构。我们的芯片主要是用来支撑深度神经网络,比如图像、语音、文字、控制等方面的任务,而不是去做所有的事情。


深度神经网络的计算结构比较特殊,比如高度的并行化、时间域上的递归、中间的节点比较稀疏,所以如果能用专门的硬件来实现,会比在CPU上用软件实现要高效,一般来说会提高2-3个数量级。


其实这个技术本身不是我们创办了地平线之后才开始做,是有一些根基的。以前在百度深度学习研究院的时候,我们当时用FPGA(可编程门阵列)来做深度神经网络的硬件实现,并取得了非常好的成果。但这个主要是应用在数据中心,去做广告的优化及语音的搜索。


地平线的市场主要在于大量的智能硬件,而不是数据中心,比如其中一个大的品类就是汽车,当然还有很多别的品类。这些深度神经网络的计算需要在本地来做,而不是云端或数据中心,因为涉及到实时性、用户体验,甚至有时会涉及到用户隐私,所以需要在本地进行计算。本地计算的要求比云端计算更高,因为一定要低功耗、低成本,而且要实时。所以,为本地计算去设计深度神经网络就变得非常重要。


关于IBM的TrueNorth,到今天为止它的方案也还没有真正推出,我们很难了解它具体是什么样的,但据我们了解,应该是在现有芯片上叠加一些功能,应该还是属于软件SDK的形式,而并不是真正为深度神经网络而设计的一个芯片。



地平线的深度神经网络计算并非基于云端,而是基于本地设备

 

Q:地平线现在做的是模拟芯片还是数字芯片?


余凯:数字芯片。

 

Q:刚才提到了计算量的问题,做深度学习的计算量是非常庞大的,因此涉及到的功耗、散热、尺寸的控制是否会导致成本不可控?


余凯:其实如果专门为这个目的做芯片,很多其他的冗余设计就可以去掉了。因为通用芯片CPU需要考虑的更多,所以从设计工艺的角度来讲CPU是更难的。


但如果是专业的深度神经网络芯片,其实从芯片的角度来讲,本质上并没有那么难,真正难的是针对算法的架构设计。因为你会希望设计一个通用的深度神经网络芯片,它可以用来做语音识别、图像识别,而图像识别里面又可以做手势、车辆、行人,人脸等,上端是可以定义的,这样的话就会有不同的网络结构,你要能去支撑它,设计出来的架构也要相对通用、灵活。所以这么说其实考验的并不是芯片设计的能力,而是算法设计的能力。


所以地平线的核心还是在于算法,我们可以说是在全球比较有实力的的深度神经网络的研发团队。


关于效率和成本问题,因为我们可以专门针对深度神经网络去做设计,比如定点化、稀疏化,以及各种专用精简设计,所以效率实际上可以做的很高,功率一般在几百毫瓦。成本方面,每个芯片应该会低于1美金。

 

Q:芯片加工工艺方面的情况呢?


余凯:如果掌握了算法,就会形成一个系统级的顶层设计,这样的话就不要求使用最先进的加工工艺。我们现在的目标是40纳米,这已经是非常成熟的工艺了。

 

Q:目前地平线做硬件、软件和算法的人员都有?


余凯:是的,包括以前在诺基亚负责手机研发的VP、Facebook人工智能研究实验室的创始成员、百度人工智能首席架构师,以及其他20多位深度学习领域的专家。

 

Q:是否可以详细介绍一下每个部门的情况?比如每个部门面临的最大的挑战。


黄畅:其实现在算法面临最大的挑战就是未来的不确定性。深度学习也算火热了几年,而且现在大家由于一些新工具的推出,使得大家使用深度学习算法的门槛已经大大降低了。但是整个学术界和工业界对它的研究一直没有停止,我们也能看到很多新的算法对于已有算法的改进。


这个不仅仅是对算法,包括我们做芯片、硬件,包括整个产品来说都是具有挑战的,我认为,这个是未来算法发展的不确定性,在不同公司之间也会体现出巨大的差异。那么,如何把握算法的发展趋势,针对自身的应用和场景,选择最合适的方向去做深入研究,这才是我们应该思考的。

 

Q:如何看算法在整个深度神经网络中的重要性?


黄畅:我们做的是人工智能,我们现在最关注的就是感知、以及稍后的决策和控制。算法在完成任务的整个过程中,扮演的其实是一个逻辑,它定义了如何去处理这些数据。当然,具体处理这些数据需要软件、硬件的承载,但它的逻辑、概念上的东西是由算法去解决的。


Q:对地平线来说,团队是一个比较大的优势,体现在哪些方面?


余凯:黄畅和我本人创立了百度深度学习研究院,也是中国企业第一次创办这种人工智能研发机构,在深度学习方面投入了相当大的资源,随后开发了中国第一个基于深度学习的语音、图像识别引擎,用来提升百度的搜索和变现。包括后来的百度自动驾驶项目都是由我们发起的。我们不光发起了很多项目、产品,同时也培养了很多人才。他们都是中国最早一批从事深度神经网络的顶尖人才。


2012年我们刚回到中国的时候,我们去清华、去中科院给大家讲深度学习,很多人都不知道什么叫深度学习。到目前,中国有很多大大小小的公司都有涉及,但真正的顶尖人才并不多,是极度稀缺的资源。地平线作为一家小公司拥有20多位深度学习方面的顶尖人才,也是Yuri Milner投资我们的重要原因。

 

Q:地平线是一家创业公司吗?公司如何定位?


余凯:我们显然是个创业公司。可能我们的人才是一般创业公司不具备的,但正因为如此,我们的创业目标也定的非常高,跟这个目标相比,我们要做的事情其实还是很有挑战的。


中国过去的创业公司有很多虽然是从小到大发展起来,但其实很多模式是在美国已经验证过了,而且不是说美国有这类的创业公司,而是公司已经上市了。而地平线目前做的事情跟美国的同行相比是在同一起跑线上。美国在这个领域能够数得上的创业公司也不多。

 

Q:地平线的产品涉及硬件、软件和算法,这毕竟不像一般性互联网创业,是一个相对技术高度密集的工作。


余凯:没错,应该这么说吧,在中国可能这种情况更明显一点,因为中国在过去更多的是商业模式方面的创业,而且很多商业模式已经在美国验证过的,而技术创业就更少了。我个人认为,能够被称为技术型公司的本土企业目前只有华为这一家。


在美国,从创业阶段开始成长起来的技术性公司还是挺多的。比如Google、Intel、微软、高通、ARM这些,这些公司从第一天开始就是技术型公司。从技术创新角度说,如果一个社会、一个国家不愿在创新方面付出代价的话,可能永远达不到一流。


Q:您在行业内的影响力当然是公司的一个巨大优势,但是在影响力之外,技术创新还是一件非常艰难的事情,您觉得接下来2-3年可预见到的门槛会在哪?


余凯:压力非常大,创业以来睡眠质量跟以前比差了非常多。要去跨越技术的门槛,市场认知的门槛、规模效应的门槛,其实是非常难的。


技术方面,虽然我们的核心是算法软件,但是我们要做到芯片里面,这样需要跨越的就不止一两个量级的难度。


另外,我们做的产品属于一个新的品类,它的应用场景到底在哪?这都是需要花很大力气去解决的。在做技术创新的过程中,如果忽略产品和商业模式的话,也只能走向死路。

 

Q:很多具体钻研某项技术的公司,会选择和产业界合作,但经常产品还是很难出来,就是所谓的单一技术很难成为产品,您怎么看这种情况?


黄畅:这也是我们跟其他强调技术的公司很不一样的一点。有很多技术性公司特别专注于其擅长的技术,希望把技术做到极致,而忽略了很多其他层面的东西,寄希望于跟别人合作。


举个例子,做人工智能算法的公司,可以只是把算法SDK授权给别人,但实际上算法只是逻辑层面的东西,它需要软件、需要硬件,甚至需要专用的芯片优化及芯片定制化设计。任何一个环节出现问题,最终产品可能都无法满足用户的需求。


专注技术的创新性公司如果没有在一个合适的土壤中成长,而是过于超前,自己又没有能力把整个产业链条打通,到后期就会出现很大的问题。


所以,我们把公司做的比较厚重,既有做算法的,又有做硬件软件的,不是停留在一个单独层面上。我们寻求的是一个突破,而这种突破我们觉得很难通过外部合作去实现。

 

Q:所以说严格意义上讲,地平线是一家做产品的公司?


杨铭:是的,我们想把这项技术做成产品去落地。当然,最终产品出来以后,可能发现算法的贡献只有10%、20%。合作当然重要,但我们想先把能满足用户的终端产品推出来。

 

Q:您说的终端产品是指芯片吗?


方懿:不止芯片,而是一个核心控制模块,具有感知、识别、理解、控制的功能。我们把这个控制模块做成产品去跟合作方做集成。这个过程中其实可以说是帮助合作方把产品做出来。我们提供的是一个带有人工智能算法的解决方案,而不会去造合作方擅长的控制、运行部分,所以在合作过程中我们带来的价值是不可替代的,我们做的是平台和引擎。



完整的AI技术解决方案:图像、语音、文字、控制。

 

Q:就合作来说,涉及到双方团队的管理、协调等问题,毕竟不像完全做产品的公司,能把整个流程管控到最后,新团队的融合还是一件挑战很大的事情。


杨铭:产品功能由我们与合作方一起来定义,我们负责核心控制模块的软硬件研发及算法集成。品质测试、可靠性测试、如何量产、市场营销则是合作方的优势,由他们来主导。刚才提到的美国一些技术型公司在产品化的过程中会遇到很多困难,但我们的优势在于,中国有很多厂商具备快速原型能力和先进的生产制造能力。


举个具体的例子,我们现在在做的汽车辅助驾驶,那么我们的主要精力就会放在算法研发上,然后放到硬件平台上去实现,做出一个跟驾驶相关、安全相关的模块。再与车厂或零部件供应商合作,来完善系统与车联接的部分,最终推出产品。


目前会采取产品、技术加服务的方式,先把产品做出来,得到第一手的用户体验,将来再向更宽广的生态去发展。我们不是单纯的技术提供商,我们很难描述我们将来会变成什么样子,但可以肯定的说:第一,我们不单纯的卖算法SDK;第二,我们不单纯出售芯片。目前的商业模式是打造技术平台,来帮助用户把产品做出来。



ADAS原型系统

 

Q:中国目前在大力发展半导体行业,国家资本的介入会如何影响芯片行业的走向?有些海外业内人士甚至抱怨芯片已经被做成了白菜价?你们怎么看?对地平线来说会产生什么影响?


黄畅:不能绝对的说是好是坏。国家的投入繁荣了国内IC设计、芯片设计行业和生态。对于我们,好的地方在于降低了风险,从找到人才、找到资源,到前端后端的设计。如果是十年、十五年前,整个行业在中国不算发达的时候,我们很难想象做算法能向芯片推进。目前在上海、深圳,整个行业的链条已经比较丰富了,从业人员也很多,至少对于我们来说是件好事。


当然,竞争越来越大,很多东西做成白菜价,终极原因就是没有差异化。差异化来自各个方面。大家普遍认为最重要的方面之一,也是最容易建立起壁垒的就是技术本身,这也是我们比较自信的地方,但我们也不会完全依靠这一点,因为很多算法型公司专注技术本身,在应用到一些具体场景的时候会有各种限制和约束,对于平台的转换会造成很大的困难。

 

Q:如何简单评价国家在半导体行业的策略?


杨铭:这个还需要很多思考。但比如现在在互联网行业、芯片行业的竞争已经比较充分,这对用户来说是好的,但对从业人员来说则要看你的竞争力强不强。国家从大的层面把芯片成本降下来,就像互联网技术发展,能把人们获取信息的成本降下来,就必须要求互联网企业提供最好的接入。


方懿:国家在这方面的投入有时也被很多人所不理解,比如通信行业,但确实催生了中国相关产业与国际接轨,并很大程度上提升了竞争力。所以我们认为,国家不管在通信行业,还是芯片行业,对于生产力和创造力的投入,对于我们公司来说是利好。


黄畅:我们想把深度学习架构做成芯片,如果门槛还是很高,对于我们这种初创公司还是不利的。我们虽然什么都做,但并不是什么都单卖,所有在这个模块下的节点,都应该是最终产品方能够接受的。如果还是一套非常昂贵的解决方案,恐怕最后会很难推到客户端上去。能让每个人都能拥有十个以上的智能硬件,这个还是需要非常强的推动力的。

 

Q:地平线会以一种什么方式切入用户?


杨铭:产品还是属于智能硬件这个领域的,但我们的切入方式会是和目前中国比较强势的制造商合作,把智能功能逐步加入到产品中去。


所以,第一步可能并不是特别炫的,不是一上来就做一个机器人,或者完成某个特别强大的功能。而是把日常生活中常用的设备逐渐加入一些智能的元素,控制成本的同时,让用户觉得这些产品在不断的变聪明。


试想,如果突然做出来一个比较智能化的机器人,让用户买来摆在家里,这恐怕是比较难接受的。


所以说,用户接受度也是一个循序渐进的过程。我们想先创造一种新的体验,下一阶段才会考虑创造出一个新的品类或设备。

聚线堂

直达业界大牛

聚线堂是线性资本旗下全新的线上互动栏目,每期邀请创业公司或巨头企业中的大牛人物,分享其行业洞见、干货放送,并与大家在微信群中直接沟通交流。第一期嘉宾——余轶南博士,原百度IDL资深工程师,曾连续两次荣获公司最高荣誉——“百度最高奖”;目前就职于地平线机器人技术,负责地平线自动驾驶项目。长按二维码添加小线菌个人微信,邀您入群直达!




更多往期精彩内容

《看客与乌合之众》

《尤里·米尔纳与地平线》

《我们是否活在机器中?》

《为什么你不能像ISIS一样招人?》

《冒险者的幸运牌》

《意识的本质是量子纠缠吗?》

《光剑到底是什么》

《如何理解技术驱动》


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存